首页
下载应用
提交文章
关于我们
🔥 热搜 🔥
1
1
2
1'"
3
bxss.me
4
@诉说趣闻
5
@纽约时间
6
1'
7
../1
8
search
9
http:bxss.me
10
http:bxss.me/
分类
社会
娱乐
国际
人权
科技
经济
其它
首页
下载应用
提交文章
关于我们
🔥
热搜
🔥
1
1
2
1'"
3
bxss.me
4
@诉说趣闻
5
@纽约时间
6
1'
7
../1
8
search
9
http:bxss.me
10
http:bxss.me/
分类
社会
娱乐
国际
人权
科技
经济
其它
二湘:朱令去世一周年,清华学子控诉清华在朱令案中的冷血和无耻
毕业论文辅导| 你又不是伞,硕士论文|毕业论文|博士论文|课题论文不行就被硬撑了,靠谱的辅导机构才是晴雨伞!
“四川大学姜涛与爱人程月玲”,你们现在还好吗?
半年狂赚63亿了,微众银行董事长,还要卷员工
为了这部描述从“反右”到“文革”的禁片,田壮壮付出了十年不能拍片的代价
生成图片,分享到微信朋友圈
1月18日 上午 11:50
4月5日 下午 8:13
4月6日 上午 8:22
4月6日 下午 8:33
4月7日 下午 8:19
4月8日 上午 8:26
4月8日 下午 8:47
4月9日 上午 8:56
4月9日 下午 9:16
4月10日 上午 9:31
4月10日 下午 9:55
4月11日 上午 10:03
4月11日 下午 10:24
4月12日 上午 10:46
4月12日 下午 10:55
4月13日 上午 11:06
4月13日 下午 11:21
4月14日 上午 11:42
4月14日 下午 11:53
4月15日 下午 12:07
4月16日 上午 12:14
4月16日 下午 12:24
4月17日 上午 12:44
4月17日 下午 12:53
4月18日 上午 1:04
4月18日 下午 1:14
4月19日 上午 1:23
4月19日 下午 1:34
4月20日 上午 1:44
4月20日 下午 1:53
4月21日 上午 2:14
4月21日 下午 2:23
4月22日 上午 2:32
4月22日 下午 2:42
4月23日 上午 2:53
4月23日 下午 3:03
4月24日 上午 3:12
4月24日 下午 3:22
4月25日 上午 3:33
4月25日 下午 3:56
4月26日 上午 4:15
4月26日 下午 4:58
4月27日 上午 5:08
4月27日 下午 5:15
4月28日 上午 5:25
4月28日 下午 5:35
4月29日 上午 5:44
4月29日 下午 5:54
4月30日 上午 6:05
4月30日 下午 6:15
5月1日 上午 6:23
5月1日 下午 6:35
5月2日 上午 6:44
5月2日 下午 6:54
5月3日 上午 7:06
5月3日 下午 7:14
5月4日 上午 7:49
5月4日 下午 8:08
5月5日 上午 8:15
5月5日 下午 8:24
5月6日 上午 8:33
5月6日 下午 8:44
5月7日 上午 9:20
5月7日 下午 9:44
5月8日 上午 10:01
5月8日 下午 10:11
5月9日 上午 10:33
5月9日 下午 10:43
5月10日 上午 11:05
5月10日 下午 11:13
5月11日 上午 11:56
5月12日 上午 12:07
5月12日 下午 12:14
5月13日 上午 1:33
5月13日 下午 11:49
5月14日 下午 12:26
5月15日 上午 2:17
5月15日 下午 2:24
5月16日 上午 2:55
5月16日 下午 3:13
5月17日 上午 3:30
5月17日 下午 3:40
5月18日 上午 3:51
5月18日 下午 4:00
5月19日 上午 4:10
5月19日 下午 4:31
5月20日 上午 4:47
5月20日 下午 5:00
5月21日 上午 5:23
5月21日 下午 5:40
5月22日 上午 6:02
5月22日 下午 6:37
5月23日 上午 6:44
5月23日 下午 7:09
5月24日 上午 7:19
5月24日 下午 7:50
5月25日 上午 7:59
5月25日 下午 8:20
5月26日 上午 8:40
5月26日 下午 10:21
5月27日 下午 12:45
5月28日 上午 1:19
5月28日 下午 2:39
5月29日 上午 2:50
5月29日 下午 3:07
5月30日 上午 3:21
5月30日 下午 3:31
5月31日 上午 4:00
5月31日 下午 4:30
6月1日 上午 4:46
6月1日 下午 5:08
6月2日 上午 5:40
6月2日 下午 5:51
6月3日 上午 6:01
6月3日 下午 6:11
6月4日 上午 6:27
6月4日 下午 6:35
6月5日 上午 6:44
6月5日 下午 6:55
6月6日 上午 7:06
6月6日 下午 7:15
6月7日 上午 7:25
6月7日 下午 7:37
6月8日 上午 7:45
6月8日 下午 7:57
6月9日 上午 8:11
6月9日 下午 8:33
6月10日 上午 8:42
6月10日 下午 8:52
6月11日 上午 9:03
6月11日 下午 9:14
6月12日 上午 9:21
6月12日 下午 9:43
6月13日 上午 10:20
6月13日 下午 10:30
6月14日 上午 10:53
6月14日 下午 11:07
6月15日 上午 11:19
6月15日 下午 11:28
6月16日 上午 11:40
6月16日 下午 11:51
6月17日 下午 12:14
6月18日 上午 12:22
6月18日 下午 12:31
6月19日 上午 12:43
6月19日 下午 1:07
6月20日 上午 1:16
6月20日 下午 1:25
6月21日 上午 8:13
6月21日 下午 9:43
6月22日 上午 11:43
6月22日 下午 11:53
6月23日 下午 12:41
6月24日 上午 12:51
6月24日 下午 1:28
6月25日 上午 1:45
6月25日 下午 2:09
6月26日 上午 2:16
6月26日 下午 2:29
6月27日 上午 2:36
6月27日 下午 2:46
6月28日 上午 3:00
6月28日 下午 4:11
6月29日 上午 4:21
6月29日 下午 4:39
6月30日 上午 4:48
6月30日 下午 5:32
7月1日 上午 5:41
7月1日 下午 6:02
7月2日 上午 6:14
7月2日 下午 6:28
7月3日 上午 6:37
7月3日 下午 6:47
7月4日 上午 6:55
7月4日 下午 7:08
7月5日 上午 7:19
7月5日 下午 7:31
7月6日 上午 7:51
7月6日 下午 8:01
7月7日 上午 8:11
7月7日 下午 8:22
7月8日 上午 8:31
7月8日 下午 8:41
7月9日 上午 8:51
7月9日 下午 9:01
7月10日 上午 9:11
7月10日 下午 9:21
7月11日 上午 9:31
7月11日 下午 9:41
7月12日 上午 9:51
7月12日 下午 10:01
7月13日 上午 10:11
7月13日 下午 10:21
7月14日 上午 10:31
7月14日 下午 10:41
7月15日 上午 10:51
7月15日 下午 11:01
7月16日 上午 11:11
7月16日 下午 11:21
7月17日 上午 11:31
7月17日 下午 11:41
7月18日 上午 11:51
7月19日 上午 12:01
7月19日 下午 12:11
7月20日 上午 12:21
7月20日 下午 12:31
7月21日 上午 12:41
7月21日 下午 12:51
7月22日 上午 1:01
7月22日 下午 1:11
7月23日 上午 1:21
7月23日 下午 1:31
7月24日 上午 1:41
7月24日 下午 1:51
7月25日 上午 2:01
7月25日 下午 2:11
7月26日 上午 2:21
7月26日 下午 2:31
7月27日 上午 2:41
7月27日 下午 2:51
7月28日 上午 3:01
7月28日 下午 3:10
7月29日 上午 3:21
7月29日 下午 3:31
7月30日 上午 3:41
7月30日 下午 3:51
7月31日 上午 4:01
7月31日 下午 4:11
8月1日 上午 4:20
8月1日 下午 4:31
8月2日 上午 4:40
8月2日 下午 4:51
8月3日 上午 5:01
8月3日 下午 5:11
8月4日 上午 5:21
8月4日 下午 5:31
8月5日 上午 5:41
8月5日 下午 5:51
8月6日 上午 6:47
8月6日 上午 7:35
8月6日 下午 7:43
8月6日 下午 7:54
8月6日 下午 8:05
8月6日 下午 8:16
8月6日 下午 8:25
8月6日 下午 8:35
8月6日 下午 8:44
8月6日 下午 8:55
8月6日 下午 9:05
8月6日 下午 9:15
8月7日 上午 10:35
8月7日 上午 11:24
8月7日 下午 12:25
8月8日 上午 12:58
8月8日 下午 1:19
8月9日 上午 1:28
8月9日 下午 1:37
8月10日 上午 1:48
8月10日 下午 1:57
8月11日 上午 2:07
8月11日 下午 2:18
8月12日 上午 2:30
8月12日 下午 2:40
8月13日 上午 2:50
8月13日 下午 3:11
8月14日 上午 3:21
8月14日 下午 3:31
8月15日 上午 3:41
8月15日 下午 3:52
8月16日 上午 4:01
8月16日 下午 4:11
8月17日 上午 4:21
8月17日 下午 4:31
8月18日 上午 4:41
8月18日 下午 4:51
8月19日 上午 5:01
8月19日 下午 5:40
8月19日 下午 6:10
8月19日 下午 6:51
8月19日 下午 7:31
8月19日 下午 8:16
8月19日 下午 8:53
8月19日 下午 9:33
8月19日 下午 10:14
8月19日 下午 10:54
8月19日 下午 11:35
8月20日 上午 12:16
8月20日 上午 1:09
8月20日 上午 1:58
8月20日 上午 2:49
8月20日 上午 3:41
8月20日 上午 4:37
8月20日 上午 5:48
8月20日 上午 6:49
8月20日 上午 7:48
8月20日 上午 8:49
8月20日 上午 9:06
8月20日 上午 10:08
8月20日 下午 11:52
8月21日 上午 1:05
8月21日 上午 2:13
8月21日 上午 3:23
8月21日 上午 4:34
8月21日 上午 5:41
8月21日 上午 6:52
8月21日 上午 8:01
8月21日 上午 9:06
8月21日 上午 10:04
8月21日 上午 10:54
8月21日 下午 11:47
8月22日 上午 12:47
8月22日 下午 2:09
8月22日 下午 3:08
8月22日 下午 4:08
8月22日 下午 5:08
8月22日 下午 6:10
8月22日 下午 7:13
8月22日 下午 8:24
8月22日 下午 9:57
8月22日 下午 11:43
8月23日 上午 1:11
8月23日 上午 2:38
查看原文
其他
AI计算,为什么要用GPU?
Original
小枣君
鲜枣课堂
2024-01-18
今天这篇文章,我们继续来聊聊芯片。
在之前的文章里,小枣君说过,行业里通常会把半导体芯片分为数字芯片和模拟芯片。其中,数字芯片的市场规模占比较大,达到70%左右。
数字芯片,还可以进一步细分,分为:逻辑芯片、存储芯片以及微控制单元(MCU)。
存储芯片和MCU以后再介绍,今天小枣君重点讲讲
逻辑芯片
。
逻辑芯片,其实说白了就是计算芯片。它包含了各种逻辑门电路,可以实现运算与逻辑判断功能,是最常见的芯片之一。
大家经常听说的CPU、GPU、FPGA、ASIC,全部都属于逻辑芯片。而现在特别火爆的AI,用到的所谓“AI芯片”,也主要是指它们。
█
CPU(中央处理器)
先说说大家最熟悉的CPU
,英文全称Central Processing Unit,中央处理器。
CPU
但凡是个人都知道,CPU是计算机的心脏。
现代计算机,都是基于1940年代诞生的冯·诺依曼架构。在这个架构中,包括了运算器(也叫逻辑运算单元,ALU)、控制器(CU)、存储器、输入设备、输出设备等组成部分。
冯·诺依曼架构
数据来了,会先放到存储器。然后,控制器会从存储器拿到相应数据,再交给运算器进行运算。运算完成后,再把结果返回到存储器。
这个流程,还有一个更有逼格的叫法:“Fetch(取指)-Decode(译码)- Execute(执行)-Memory Access(访存)-Write Back(写回)”。
大家看到了,运算器和控制器这两个核心功能,都是由CPU负责承担的。
具体来说,运算器(包括加法器、减法器、乘法器、除法器),负责执行算术和逻辑运算,是真正干活的。控制器,负责从内存中读取指令、解码指令、执行指令,是指手画脚的。
除了运算器和控制器之外,CPU还包括时钟模块和寄存器(高速缓存)等组件。
时钟模块负责管理CPU的时间,为CPU提供稳定的时基。它通过周期性地发出信号,驱动CPU中的所有操作,调度各个模块的工作。
寄存器是CPU中的高速存储器,用于暂时保存指令和数据。它的CPU与内存(RAM)之间的“缓冲”,速度比一般的内存更快,避免内存“拖累”CPU的工作。
寄存器的容量和存取性能,可以影响CPU到对内存的访问次数,进而影响整个系统的效率。后面我们讲存储芯片的时候,还会提到它。
CPU一般会基于指令集架构进行分类,包括x86架构和非x86架构。x86基本上都是复杂指令集(CISC),而非x86基本为精简指令集(RISC)。
PC和大部分服务器用的是x86架构,英特尔和AMD公司占据主导地位。非x86架构的类型比较多,这些年崛起速度很快,主要有ARM、MIPS、Power、RISC-V、Alpha等。以后会专门介绍。
█
GPU(图形处理器)
再来看看GPU。
GPU是显卡的核心部件,英文全名叫Graphics Processing Unit,图形处理单元(图形处理器)。
GPU并不能和显卡划等号。显卡除了GPU之外,还包括显存、VRM稳压模块、MRAM芯片、总线、风扇、外围设备接口等。
显卡
1999年,英伟达(NVIDIA)公司率先提出了GPU的概念。
之所以要提出GPU,是因为90年代游戏和多媒体业务高速发展。这些业务给计算机的3D图形处理和渲染能力提出了更高的要求。传统CPU搞不定,所以引入了GPU,分担这方面的工作。
根据形态,GPU可分为独立GPU(dGPU,discrete/dedicated GPU)和集成GPU(iGPU,integrated GPU),也就是常说的独显、集显。
GPU也是计算芯片。所以,它和CPU一样,包括了运算器、控制器和寄存器等组件。
但是,因为GPU主要负责图形处理任务,所以,它的内部架构和CPU存在很大的不同。
如上图所示,CPU的内核(包括了ALU)数量比较少,最多只有几十个。但是,CPU有大量的缓存(Cache)和复杂的控制器(CU)。
这样设计的原因,是因为CPU是一个通用处理器。作为计算机的主核心,它的任务非常复杂,既要应对不同类型的数据计算,还要响应人机交互。
复杂的条件和分支,还有任务之间的同步协调,会带来大量的分支跳转和中断处理工作。它需要更大的缓存,保存各种任务状态,以降低任务切换时的时延。它也需要更复杂的控制器,进行逻辑控制和调度。
CPU的强项是管理和调度。真正干活的功能,反而不强(ALU占比大约5%~20%)。
如果我们把处理器看成是一个餐厅的话,CPU就像一个拥有几十名高级厨师的全能型餐厅。这个餐厅什么菜系都能做,但是,因为菜系多,所以需要花费大量的时间协调、配菜,上菜的速度相对比较慢。
而GPU则完全不同。
GPU为图形处理而生,任务非常明确且单一。它要做的,就是图形渲染。图形是由海量像素点组成的,属于类型高度统一、相互无依赖的大规模数据。
所以,GPU的任务,是在最短的时间里,完成大量同质化数据的并行运算。所谓调度和协调的“杂活”,反而很少。
并行计算,当然需要更多的核啊。
如前图所示,GPU的内核数,远远超过CPU,可以达到几千个甚至上万个(也因此被称为“众核”)。
RTX4090有16384个流处理器
GPU的核,称为流式多处理器(Stream Multi-processor,SM),是一个独立的任务处理单元。
在整个GPU中,会划分为多个流式处理区。每个处理区,包含数百个内核。每个内核,相当于一颗简化版的CPU,具备整数运算和浮点运算的功能,以及排队和结果收集功能。
GPU的控制器功能简单,缓存也比较少。它的ALU占比,可以达到80%以上。
虽然GPU单核的处理能力弱于CPU,但是数量庞大,非常适合高强度并行计算。同等晶体管规模条件下,它的算力,反而比CPU更强。
还是以餐厅为例。
GPU就像一个拥有成千上万名初级厨师的单一型餐厅。它只适合做某种指定菜系。但是,因为厨师多,配菜简单,所以大家一起炒,上菜速度反而快。
CPU vs GPU
█
GPU与AI计算
大家都知道,现在的AI计算,都在抢购GPU。英伟达也因此赚得盆满钵满。为什么会这样呢?
原因很简单,因为AI计算和图形计算一样,也包含了大量的高强度并行计算任务。
深度学习是目前最主流的人工智能算法。从过程来看,包括训练(training)和推理(inference)两个环节
。
在训练环节,通过投喂大量的数据,训练出一个复杂的神经网络模型。
在推理环节,利用训练好的模型,使用大量数据推理出各种结论。
训练环节由于涉及海量的训练数据,以及复杂的深度神经网络结构,所以需要的计算规模非常庞大,对芯片的算力性能要求比较高。而推理环节,对简单指定的重复计算和低延迟的要求很高。
它们所采用的具体算法,包括矩阵相乘、卷积、循环层、梯度运算等,分解为大量并行任务,可以有效缩短任务完成的时间。
GPU凭借自身强悍的并行计算能力以及内存带宽,可以很好地应对训练和推理任务,已经成为业界在深度学习领域的首选解决方案。
目前,大部分企业的AI训练,采用的是英伟达的GPU集群。如果进行合理优化,一块GPU卡,可以提供相当于数十其至上百台CPU服务器的算力。
NVIDIA HGX A100 8 GPU 组件
不过,在推理环节,GPU的市场份额占比并没有那么高。具体原因我们后面会讲。
将GPU应用于图形之外的计算,最早源于2003年。
那一年,GPGPU(General Purpose computing on GPU,基于GPU的通用计算)的概念首次被提出。意指利用GPU的计算能力,在非图形处理领域进行更通用、更广泛的科学计算。
GPGPU在传统GPU的基础上,进行了进一步的优化设计,使之更适合高性能并行计算。
2009年,斯坦福的几位学者,首次展示了利用GPU训练深度神经网络的成果,引起了轰动。
几年后,2012年,神经网络之父杰弗里·辛顿(Geoffrey Hinton)的两个学生——亚历克斯·克里切夫斯基(Alex Krizhevsky)、伊利亚·苏茨克沃(Ilya Sutskever),利用“深度学习+GPU”的方案,提出了深度神经网络AlexNet,将识别成功率从74%提升到85%,一举赢得Image Net挑战赛的冠军。
左起:伊利亚·苏茨克沃,亚历克斯·克里切夫斯基,杰弗里·辛顿
这彻底引爆了“AI+GPU”的浪潮。英伟达公司迅速跟进,砸了大量的资源,在三年时间里,将GPU性能提升了65倍。
除了硬刚算力之外,他们还积极构建围绕GPU的开发生态。他们建立了基于自家GPU的CUDA(Compute Unified Device Architecture)生态系统,提供完善的开发环境和方案,帮助开发人员更容易地使用GPU进行深度学习开发或高性能运算。
这些早期的精心布局,最终帮助英伟达在AIGC爆发时收获了巨大的红利。目前,他们市值高达1.22万亿美元(英特尔的近6倍),是名副其实的“AI无冕之王”。
那么,AI时代的计算,是不是GPU一家通吃呢?我们经常听说的FPGA和ASIC,好像也是不错的计算芯片。它们的区别和优势在哪里呢?
敬请期待下集:
《到底什么是ASIC和FPGA》
参考文献:
1、《一文搞懂GPU的概念、工作原理》,开源LINUX;
2、《AI芯片架构体系综述》,知乎,Garvin Li;
3、《GPU、FPGA、ASIC加速器有什么区别?》,知乎,胡说漫谈;
4、《带你深入了解GPU、FPGA和ASIC》,汽车产业前线观察;
5、《为什么GPU是AI时代的算力核心》,沐曦集成电路;
6、《一文通览自动驾驶三大主流芯片架构》,数字化转型;
7、《AIGC算力全景与趋势报告》,量子位;
8、百度百科、维基百科。
继续滑动看下一个
AI计算,为什么要用GPU?
Original
小枣君
鲜枣课堂
轻触阅读原文
鲜枣课堂
向上滑动看下一个
您可能也对以下帖子感兴趣
{{{title}}}
文章有问题?点此查看未经处理的缓存